이것은 대화형 노트북입니다. 로컬에서 실행하거나 아래 링크를 사용할 수 있습니다:
Weave와 통합: 프로덕션 대시보드
GenAI 도구 환경은 빠르게 진화하고 있습니다 - 새로운 프레임워크, 도구 및 애플리케이션이 계속해서 등장하고 있습니다. Weave는 모든 GenAI 모니터링 및 평가 요구 사항을 위한 원스톱 솔루션이 되는 것을 목표로 합니다. 이는 때로는 기존 플랫폼과 통합하거나 프로젝트 또는 조직의 특정 요구 사항에 맞게 Weave를 확장해야 할 필요가 있음을 의미합니다. 이 쿡북에서는 Weave의 강력한 API와 함수를 활용하여 Weave의 Traces 뷰를 확장하는 프로덕션 모니터링을 위한 커스텀 대시보드를 만드는 방법을 보여드리겠습니다. 다음 사항에 중점을 둘 것입니다:- Weave에서 트레이스, 비용, 피드백 및 기타 메트릭 가져오기
- 사용자 피드백 및 비용 분포에 대한 집계 뷰 생성
- 시간에 따른 토큰 사용량 및 지연 시간에 대한 시각화 생성

1. 설정
이 튜토리얼을 따라하기 위해서는 다음 패키지만 설치하면 됩니다:2. 구현
2.1 Weave 클라이언트 초기화 및 비용 정의
먼저, Weave 클라이언트를 초기화하고 각 모델에 대한 비용을 추가하는 함수를 설정하겠습니다.- 많은 표준 모델에 대한 표준 비용을 포함했지만 자체 커스텀 비용과 커스텀 모델을 쉽게 추가할 수 있도록 했습니다. 다음에서는 몇 가지 모델에 대한 커스텀 비용을 추가하고 나머지는 표준 비용을 사용하는 방법을 보여드리겠습니다.
- 비용은 Weave에서 각 호출에 대해 추적된 토큰을 기반으로 계산됩니다. 많은 LLM 벤더 라이브러리의 경우, 토큰 사용량을 자동으로 추적하지만 모든 호출에 대해 커스텀 토큰 수를 반환하는 것도 가능합니다. 커스텀 모델에 대한 토큰 수 및 비용 계산을 정의하는 방법에 대한 이 쿡북을 참조하세요 - 커스텀 비용 쿡북.
2.2 Weave에서 호출 데이터 가져오기
Weave에서 호출 데이터를 가져오기 위해 두 가지 옵션이 있습니다:- 호출별 데이터 가져오기
- 고수준 API 사용하기
2.2.1 호출별 데이터 가져오기
Weave에서 데이터에 접근하는 첫 번째 옵션은 필터링된 호출 목록을 검색하고 호출별로 원하는 데이터를 추출하는 것입니다. 이를 위해calls_query_stream
API를 사용하여 Weave에서 호출 데이터를 가져올 수 있습니다:
calls_query_stream
API: This API allows us to fetch the calls data from Weave.filter
dictionary: This dictionary contains the filter parameters to fetch the calls data - see 여기에서 자세한 내용을 확인하세요.expand_columns
list: This list contains the columns to expand in the calls data.sort_by
list: This list contains the sorting parameters for the calls data.include_costs
boolean: This boolean indicates whether to include the costs in the calls data.include_feedback
boolean: This boolean indicates whether to include the feedback in the calls data.
2.2.2 고수준 API 사용하기
모든 호출을 일일이 살펴보는 대신 Weave는 모델 비용, 피드백 및 기타 메트릭에 직접 접근할 수 있는 고수준 API를 제공합니다. 예를 들어, 비용의 경우query_costs
API를 사용하여 프로젝트에서 사용된 모든 LLM의 비용을 가져옵니다:
2.4 입력 수집 및 시각화 생성
다음으로, plotly를 사용하여 시각화를 생성할 수 있습니다. 이것은 가장 기본적인 대시보드이지만 원하는 대로 커스터마이즈할 수 있습니다! 더 복잡한 예제는 Streamlit 예제를 여기에서 확인하세요.결론
이 쿡북에서는 Weave의 API와 함수를 사용하여 커스텀 프로덕션 모니터링 대시보드를 만드는 방법을 보여드렸습니다. Weave는 현재 데이터의 쉬운 입력과 커스텀 프로세스를 위한 데이터 추출을 위한 빠른 통합에 중점을 두고 있습니다.- 데이터 입력:
- 프레임워크에 구애받지 않는 트레이싱 @weave-op() 데코레이터와 CSV에서 호출을 가져올 수 있는 가능성 (관련 가져오기 쿡북 참조)
- 다양한 프로그래밍 프레임워크 및 언어에서 Weave에 로깅하기 위한 서비스 API 엔드포인트, 여기에서 자세한 내용을 확인하세요.
- 데이터 출력: